Recodificar variables

Metodologia Quantitativa (UPF)

Jordi Mas Elias

https://www.jordimas.cat/

Sumari

  • Operadors booleans
  • Relabel functions
  • Funció factor
  • Funcions as.xxxx

Warm up

Corba d’aprenentatge d’R

RStudio workflow

Carreguem paquets

library(dplyr)
library(ggplot2)
library(readr)
library(stringr)
library(forcats)
library(readxl)
library(vdemdata)

Funcions i operadors

Operadors booleans

  • AND (&): TRUE si totes les condicions estan satisfetes.
  • OR (|): TRUE si alguna condició està satisfeta.
  • NOT (!): TRUE si la condició no està satisfeta.

Recoding functions

Quan recodifiquem variables, perdem informació1.

A Funció
Binària if_else()
Categòrica case_when(), case_match()
Ordinal factor()
Altres as.numeric(), as.character(), as.Date(), etc.

Reetiquetar

If_else

  • A variable dicotòmica / binària / dummy.
df |> 
  mutate(new_name = if_else(logic operation, true, false))

Case_when

df |> 
  mutate(new_var = case_when(logic operation ~ "C1",
                             logic operation ~ "C2",
                             logic operation ~ "C3",
                             ...,
                             .default ~ "CN"))

Case_match

df |> 
  mutate(new_var = case_match(variable,
                              "c1" ~ "C1",
                              "c2" ~ "C2",
                              "c3" ~ "C3",
                              ...,
                              .default = "CN"))

Factor

df |> 
  mutate(new_vector = factor(wb$income_group, 
                             ordered = TRUE,
                             [levels o labels = ...]))

Funcions as.xxxxx

  • as.numeric(vector)
  • as.factor(vector)
  • as.character(vector)
  • as.integer(vector)
  • as.Date(vector)